78 research outputs found

    Editorial

    Get PDF
    Editorial InCID: Revista de Ciência da Informação e Documentação, v. 3, n. 1, jan./jun. 201

    A descrição formal da qualidade de dados publicados na Web: análise do Data Quality Vocabulary (DQV)

    Get PDF
    The quality assessment process plays an important role in the reuse of data made available on the Web. To ensure the use and reuse of these data, it is necessary to formally describe them in a way that computational agents can understand. One of the possibilities to make this description viable is the Data Quality Vocabulary, elaborated by the World Wide Web Consortium. The objective was to verify the impact of the Data Quality Vocabulary in the process of formal description of the quality of data published on the Web, analyzing the objectives, characteristics, and structure of the vocabulary. The research has an exploratory and descriptive character, adopting as a method a study of the official documentation published by the consortium. As a result, an overview of the scenario that led to the development of the vocabulary was obtained, its structure was presented and its potential application was discussed. It is concluded that the Data Quality Vocabulary provides a general and customizable descriptive structure for providing the results of the data quality assessment process, which allows these results to be shared by its providers. It also allows the community to participate in the evaluation process and formally share the results obtained, thus reducing rework. It is also concluded that the vocabulary contributes to the reuse of data in the context of the Web by facilitating the use of automatic and semi-automatic tools in the evaluation and selection of data sources for the application. O processo de avaliação de qualidade desempenha um papel importante na reutilização dos dados disponibilizados na Web. Para garantir o uso e reuso desses dados faz-se necessária à sua descrição formal, de maneira compreensível à agentes computacionais. Uma das possibilidades para viabilizar essa descrição é o Data Quality Vocabulary, elaborado pelo Word Wide Web Consortium.  Objetivou-se verificar o impacto do Data Quality Vocabulary no processo de descrição formal da qualidade de dados publicados na Web, analisando os objetivos, características e a estrutura do vocabulário. A pesquisa possuí um caráter exploratório e descritivo, adotando como método um estudo da documentação oficial publicada pelo consórcio. Como resultados obteve-se um panorama do cenário que levou ao desenvolvimento do vocabulário, foi apresentada sua estrutura e discutido o seu potencial de aplicação. Conclui-se que o Data Quality Vocabulary disponibiliza uma estrutura descritiva geral e customizável para o fornecimento de resultados do processo de avaliação de qualidade de dados, o que permite que esses resultados sejam compartilhados pelos seus fornecedores. Permite ainda que a comunidade participe do processo de avaliação e compartilhe os resultados obtidos de maneira formal, diminuindo assim o retrabalho. Conclui-se ainda que o vocabulário contribui para o reuso de dados no contexto da Web ao facilitar o uso de ferramentas automáticas e semiautomáticas no processo de avaliação e seleção de fontes de dados para a aplicaçã

    Rede de tags para recuperação da informação no contexto da Representação Iterativa

    Get PDF
    Information retrieval is a recurrent subject in search of information science. This kind of study aim to improve results in both searches on the Web and in various other digital information environment. In this context, the Iterative Representation model suggested for digital repositories, appears as a differential that changes the paradigm of self-archiving of digital objects, creating a concept of relationship between terms that link the user thought the material deposited in the digital environment. The links effect by the Iterative Representation aided Assisted Folksonomy generate a shaped structure that connects networks, vertically and horizontally, the objects deposited, relying on some kind of structure for representing knowledge of specialty areas and therefore, creating an information network based on knowledge of users. The network of information created, called the network of tags is dynamic and effective a different model of information retrieval and study of digital information repositories.A recuperação da informação tem sido abordada constantemente dentro da Ciência da Informação, gerando e incentivando vários estudos que levem a melhorar os resultados em buscas tanto na Web como em vários  outros ambientes digitais informacionais. Neste contexto a Representação Iterativa, modelo sugerido para repositórios digitais, aparece como um diferencial que altera o paradigma do auto-arquivamento de objetos digitais criando um conceito de relacionamento entre os termos que ligam o pensamento do usuário ao material depositado no ambiente digital. As ligações efetivadas pela Representação Iterativa com auxílio da Folksonomia Assistida geram uma estrutura em formato de redes que conecta de forma vertical e horizontal os objetos depositados, apoiando-se em algum tipo de estrutura de representação do conhecimento das áreas de especialidades e portanto criando uma rede de informações baseada no conhecimento dos usuários. A rede de informações criada, chamada de rede de tags, é dinâmica e efetiva um modelo diferente de recuperação da informação e estudo dos repositórios digitais informacionais

    Web semântica na Europeana: uma abordagem do padrão EDM

    Get PDF
    Objective. The Semantic Web and Linked Data emphasize on the reuse and linking of richly described resources on the Web. This principles fits the purpose of the Europeana Data Model (EDM), which is to make use of existing resource information as well as to support their enrichment by establishing new relationships between them. The objective of this study is to describe the semantic relationships included in the elements of the EDM, as well as to highlight the advantages of using this model to represent and retrieve information digitized culture on the Web and thus encourage the adoption of semantic methodologies in Brazilian projects.Method. This is a qualitative research, based on a descriptive-document method, regarding the family of EDM documents. First we have identified the concepts and technologies of the Semantic Web and Linked Data, then we analyze the descriptive memoir of the data model of Europeana. We detail the principles and development of EDM, with an emphasis on the semantic elements that support specific functions in Europeana.Results. We have identified the possibilities of connecting data from different institutions in order to complement and enrich the information of the records about a particular cultural heritage object.Conclusions. This study showed that the semantic structure of the EDM constitutes a reference to be followed for publication of data of national Linked Open Data projects to ensure the increasing interconnection of data, to increase the speed of the circulation of the information between the interested parties and accelerate new discoveries.Objetivo. La Web Semántica y los Datos Enlazados hacen hincapié en la reutilización y la vinculación de los recursos ricamente descritos en la Web. Estos principios se ajustan al propósito del Modelo de Datos de Europeana (EDM) de utilizar la información de los recursos existentes y apoyar su enriquecimiento estableciendo nuevas relaciones entre ellos. Así, el objetivo de este estudio es describir las relaciones semánticas incrustadas en los elementos de la EDM, destacando las ventajas de la utilización de este modelo para la recuperación de información en la Web y, de este modo, fomentar la adopción de metodologías semánticas en los proyectos brasileños.Método. Se trata de una investigación cualitativa de carácter descriptivo-documental, basada en la familia documental EDM. En primer lugar, el estudio identificó los conceptos y tecnologías de la web semántica y los datos enlazados, y a continuación analizó el memorial descriptivo del modelo de datos de Europeana. Se detallaron los principios y el desarrollo del EDM, haciendo hincapié en los elementos semánticos que modelan y apoyan la funcionalidad de Europeana.Resultados. Como resultado, se identificaron las posibilidades de conectar datos de diferentes instituciones, con el fin de enriquecer la información de los registros de un determinado objeto del patrimonio cultural. Conclusiones. Este estudio demostró, a través de las relaciones semánticas, que la estructura semántica de EDM constituye una referencia a seguir para la publicación de datos de proyectos nacionales en Linked Open Data, con el fin de garantizar la creciente interconexión de los datos, aumentar la velocidad de circulación de la información entre las partes interesadas y acelerar nuevos descubrimientos.Objetivo. A Web Semântica e o Linked Data enfatizam a reutilização e a ligação de recursos ricamente descritos na Web. Estes princípios ajustam-se ao propósito do Modelo de Dados da Europeana (EDM) de utilizar informações de recursos existentes e apoiar o seu enriquecimento por meio do estabelecimento de novas relações entre eles. Assim, o objetivo deste estudo é descrever as relações semânticas inseridas nos elementos do EDM, destacando as vantagens de uso desse modelo para recuperação da informação na Web e, dessa forma, incentivar a adoção de metodologias semânticas em projetos brasileiros.Método. Trata-se de uma pesquisa de natureza qualitativa do tipo descritiva-documental, baseada na família de documentos do EDM. Primeiramente o estudo identificou os conceitos e tecnologias da Web Semântica e Linked Data, em seguida, analisou o memorial descritivo do modelo de dados da Europeana. O EDM foi detalhado em seus princípios e desenvolvimento, com ênfase nos elementos semânticos que modelam e apoiam a funcionalidade da Europeana.Resultados. Como resultado foram identificadas as possibilidades de conexão dos dados de diferentes instituições, de forma a enriquecer as informações dos registros de um determinado objeto do patrimônio cultural.Conclusões. Este estudo mostrou, por meio das relações semânticas, que a estrutura semântica do EDM constitui-se em uma referência a ser seguida para publicação de dados de projetos nacionais no Linked Open Data, para garantir a interconexão cada vez maior de dados, aumentar a velocidade da circulação da informação entre os interessados e acelerar novas descobertas.   

    Informação, ética e tecnologia. Uma entrevista com o Professor Enrique Muriel-Torrado

    Get PDF
    O Professor Enrique Muriel-Torrado possui graduação em Biblioteconomía y Documentación pela Universidade de Extremadura, Licenciatura em Documentación pela Universidade de Extremadura, Mestrado em Información Científica - Universidad de Granada, Mestrado em Documentación Digital - Universitat Pompeu Fabra, Doutorado em Documentación - Universidad de Granada e Pós Doutorado na UFSC. Tem experiência na área de Vigilância Tecnológica, com ênfase em Ciência da Informação, atuando principalmente nos seguintes temas: Copyleft, Creative Commons, Copyright, direitos autorais, e competência informacional. Atualmente pesquisa sobre serviços e ferramentas tecnológicas em unidades da informação. É Professor da Universidade Federal de Santa Catarina - UFSC e está vinculado ao grupo de pesquisa Inteligência, Tecnologia e Informação - Research Groupl - ITI-RG.Entrevista concedida em: 30/09/201

    Big Data: fatores potencialmente discriminatórios em análise de dados

    Get PDF
    The experienced technological changes from the turn of the century caused a revolution in the Big Data society, in which the data analysis to determine patterns and behaviors could use large amounts of data. It is possible to notice that some analyses in the context of the Big Data are being conducted to generate discriminatory results. This study aims to identify factors that can potentially lead to discrimination in the process of data analysis. The methodology used was qualitative, exploratory and bibliographical, enumerating the discrimination cases. As the result, we identified possibly discriminatory factors and we provided an explanation of these factors. Through research, we noticed the need of showing deep reflection about the results that are obtained from the data analysis and the need of Information Science approaching such questions, in order to point out the paths to be taken.As mudanças tecnológicas vividas a partir da virada do século causaram uma revolução na sociedade, chamada de Big Data, em que as análises de dados para determinar padrões e comportamentos puderam utilizar grandes quantidades de dados. Verifica-se que algumas análises, no contexto do Big Data, estão sendo conduzidas a gerar resultados discriminatórios. O estudo tem como objetivo identificar fatores que, potencialmente, possam gerar discriminação durante o processo de análise de dados. Para tal, a metodologia utilizada foi de natureza qualitativa, exploratória e bibliográfica, enumerando em um quadro os casos de discriminação. Como resultado, identificam-se fatores possivelmente discriminatórios, além de ser feita uma explanação desses fatores. Por meio da pesquisa, verifica-se uma necessidade de existir reflexões profundas dos resultados que são obtidos a partir de análises de dados, ficando clara a necessidade da Ciência da Informação retratar tais questões, a fim de apontar os caminhos a serem tomados

    Informação, ética e tecnologia. Uma entrevista com o Professor Enrique Muriel-Torrado

    Get PDF
    O Professor Enrique Muriel-Torrado possui graduação em Biblioteconomía y Documentación pela Universidade de Extremadura, Licenciatura em Documentación pela Universidade de Extremadura, Mestrado em Información Científica - Universidad de Granada, Mestrado em Documentación Digital - Universitat Pompeu Fabra, Doutorado em Documentación - Universidad de Granada e Pós Doutorado na UFSC. Tem experiência na área de Vigilância Tecnológica, com ênfase em Ciência da Informação, atuando principalmente nos seguintes temas: Copyleft, Creative Commons, Copyright, direitos autorais, e competência informacional. Atualmente pesquisa sobre serviços e ferramentas tecnológicas em unidades da informação. É Professor da Universidade Federal de Santa Catarina - UFSC e está vinculado ao grupo de pesquisa Inteligência, Tecnologia e Informação - Research Groupl - ITI-RG. Entrevista concedida em: 30/09/201

    Tecnologias da web semântica para a recuperação da informação no wikidata

    Get PDF
    A Recuperação da Informação é responsável pelo armazenamento e pela recuperação automática de informação, podendo estes documentos ser constituídos por textos, páginas Web, áudio, vídeo, imagens, gráficos e figuras. Técnicas de Recuperação de Informação ganharam importância com o crescimento da Web, pois a quantidade ilimitada de informação pode expressar as mais diversas formas e níveis de qualidade ao que se espera. Pensando nisso o presente trabalho estuda métodos e tecnologias capazes de recuperar essas informações, dando enfoque a buscar em bases de dados estruturadas chamadas Linked Data, mas especificamente no Wikidata, uma base de dados estruturada utilizando conceitos da Web Semântica, que reúne conhecimentos da Wikipédia. Buscando compreender como é feita essa recuperação da informação no projeto Wikidata, esta pesquisa tem como objetivo apresentar os meios que o Wikidata fornece para a RI e como eles usam os princípios da Web Semântica. A metodologia utilizada foi um estudo exploratório com embasamento para a pesquisa e aplicada, uma vez que testes foram feitos na base de dados do Wikidata. Como resultados, identificou-se características das diversas formas de acesso e de recuperação dos dados, traçando correlações existentes entre cada uma destas formas, com o arcabouço teórico da Web Semântica e da Recuperação da Informação. Concluiu-se que o Wikidata se coloca como uma base de dados sólida, com um grande volume de conteúdo que possui uma série de mecanismos de recuperação, capazes de atender às mais diversas aplicações existentes na Web, devido a estes mecanismos serem construídos com distintas tecnologias e configurações
    corecore